【疑问】经典哈希算法里的seed能换成别的数字吗

请教一个哈希算法的问题:BKDRHash的seed是为什么是31、131、1313、13131、131313...,别的数字不行吗?

算法如下:
template<class T>
size_t BKDRHash(const T *str)
{
    register size_t hash = 0;
    while (size_t ch = (size_t)*str++)
    {
        //也可以乘以31、131、1313、13131、131313...
        hash = hash * 131 + ch;   
    }
    return hash;
}
参考文章《字符串Hash函数对比》http://blog.csdn.net/icefireelf/article/details/5796529

类似地,RSHash的63689、378551是如何而来,能否替换为其他数字?
63689、378551都是质数,而BKDRHash中的除了31、131是质数外,1313、13131、131313都是合数(查质数表) 

/// @brief RS Hash Function
/// @detail 因Robert Sedgwicks在其《Algorithms in C》一书中展示而得名。
template<class T>
size_t RSHash(const T *str)
{
register size_t hash = 0;
size_t magic = 63689; 
while (size_t ch = (size_t)*str++)
{
hash = hash * magic + ch;
magic *= 378551;
}
return hash;


其实我问这个问题是为了应用BloomFilter,这个算法需要k个不同的哈希函数,“选择k个不同的哈希函数比较麻烦,一种简单的方法是选择一个哈希函数,然后送入k个不同的参数。”我想知道的是,把RSHash的63689和378551修改为另外两个大素数,是否会导致散列分布没有原算法均匀。 


参考文章《BloomFilter——大规模数据处理利器》
http://www.cnblogs.com/heaad/archive/2011/01/02/1924195.html

Bloom Filter是由Bloom在1970年提出的一种多哈希函数映射的快速查找算法。通常应用在一些需要快速判断某个元素是否属于集合,但是并不严格要求100%正确的场合。


我想知道的是,把RSHash的63689和378551修改为另外两个大素数,是否会导致散列分布没有原算法均匀 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值